Wprowadzenie do kursu
Piotr Pasza Storożenko@Appsilon
Piotr Pasza Storożenko, Machine Learning Engineer
Trochę:
więcej na moim blogu pstorozenko.github.io.
Menti time
Przez kilka lat zdobyłem dużo wiedzy na temat pythona, R-a, julia’i, data science, machine learningu, deep learningu, programowania.
Teraz mogę się nią podzielić z Wami!
Temat mojej magisterki:
Competition for attention between online social memes.
Menti time
Osoba która jednocześnie:
Biznes mówi o AI, specjaliści raczej o ML…
numpy czyli praca na liczbachpandas czyli ramki danychmatplotlib i plotly czyli wykresyscikit-learn czyli wstęp do machine learningustreamlit czyli dashboardyAnaconda to standard jeżeli chodzi o zarządzanie wersjami pythona w środowisku data science/machine learningu. Pozwala na uzyskanie konsystentnego środowiska pomiędzy różnymi systemami.
Dlaczego to ważne?
W pracy DSowca bardzo często pracujesz nad kilkoma różnymi projektami jednocześnie. Każdy z projektów może wymagać określonego środowiska, z określonymi wersjami pythona i bibliotek.
To rozwiązanie może być również przydatne przy wielu różnych przedmiotach na studiach!
Po zainstalowaniu anacondy należy sklonować repozytorium kursu, w terminalu przejść do folderu z repo, a następnie wywołać:
conda create -n daftacademy-ds python
zaakceptować instalację środowiska i dalej:
conda activate daftacademy-ds
pip install -r requirements.txt
Jeżeli otrzymujesz komunikat
ERROR: Could not open requirements file: [Errno 2] No such file or directory: 'requirements.txt'
to znaczy, że jesteś w złym folderze.
W razie problemów z polecam zapoznać się z oficjalnym tutorialem do condy.
Dlaczego VS Code?
Zainstaluj rozszerzenia:
Środowisko gotowe do pracy i nauki!
pip vs conda vs pipenv vs …We need multiple environments on a single machine.
How to live, what to use?
NEVER PLAY WITH DATA SCIENCE ON YOUR DEFAULT SYSTEM’S PYTHON
pip + virtualenvpip freezeconda3.9/3.10) and minor (3.10.3/3.10.4) python versionsR or CUDA drivers)conda list --exportpipenvpip + virtualenv plus different python versionsThe most reliable setup for experimenting is to do:
conda create -n my-env python==3.10.4
conda activate my-env
pip install ...
If you need to install CUDA drivers then do it on environment creation conda create -n my-env python cudatoolkit.
After you install all packages, save in README file python version, e.g.,
Project created with python 3.10.4.
and store installed packages with pip freeze > requirements.txt.
Remember that not every package version is available for every python version. For example Tensorflow 2.10 is supported only in python>=3.10.